智能论文笔记

A Survey on Large-Population Systems and Scalable Multi-Agent Reinforcement Learning

Kai Cui , Anam Tahir , Gizem Ekinci , Ahmed Elshamanhory , Yannick Eich , Mengguang Li , Heinz Koeppl

分类：人工智能 | 机器学习

2022-09-08

大型人口系统的分析和控制对研究和工程的各个领域引起了极大的兴趣，从机器人群的流行病学到经济学和金融。一种越来越流行和有效的方法来实现多代理系统中的顺序决策，这是通过多机构增强学习，因为它允许对高度复杂的系统进行自动和无模型的分析。但是，可伸缩性的关键问题使控制和增强学习算法的设计变得复杂，尤其是在具有大量代理的系统中。尽管强化学习在许多情况下都发现了经验成功，但许多代理商的问题很快就变得棘手了，需要特别考虑。在这项调查中，我们将阐明当前的方法，以通过多代理强化学习以及通过诸如平均场游戏，集体智能或复杂的网络理论等研究领域进行仔细理解和分析大型人口系统。这些经典独立的主题领域提供了多种理解或建模大型人口系统的方法，这可能非常适合将来的可拖动MARL算法制定。最后，我们调查了大规模控制的潜在应用领域，并确定了实用系统中学习算法的富有成果的未来应用。我们希望我们的调查可以为理论和应用科学的初级和高级研究人员提供洞察力和未来的方向。

translated by 谷歌翻译

The effects of gender bias in word embeddings on depression prediction

Gizem Sogancioglu , Heysem Kaya

分类：自然语言处理 | 机器学习

2022-12-15

Word embeddings are extensively used in various NLP problems as a state-of-the-art semantic feature vector representation. Despite their success on various tasks and domains, they might exhibit an undesired bias for stereotypical categories due to statistical and societal biases that exist in the dataset they are trained on. In this study, we analyze the gender bias in four different pre-trained word embeddings specifically for the depression category in the mental disorder domain. We use contextual and non-contextual embeddings that are trained on domain-independent as well as clinical domain-specific data. We observe that embeddings carry bias for depression towards different gender groups depending on the type of embeddings. Moreover, we demonstrate that these undesired correlations are transferred to the downstream task for depression phenotype recognition. We find that data augmentation by simply swapping gender words mitigates the bias significantly in the downstream task.

translated by 谷歌翻译

Interactive Sketching of Mannequin Poses

Gizem Unlu , Mohamed Sayed , Gabriel Brostow

分类：计算机视觉

2022-12-14

It can be easy and even fun to sketch humans in different poses. In contrast, creating those same poses on a 3D graphics "mannequin" is comparatively tedious. Yet 3D body poses are necessary for various downstream applications. We seek to preserve the convenience of 2D sketching while giving users of different skill levels the flexibility to accurately and more quickly pose\slash refine a 3D mannequin. At the core of the interactive system, we propose a machine-learning model for inferring the 3D pose of a CG mannequin from sketches of humans drawn in a cylinder-person style. Training such a model is challenging because of artist variability, a lack of sketch training data with corresponding ground truth 3D poses, and the high dimensionality of human pose-space. Our unique approach to synthesizing vector graphics training data underpins our integrated ML-and-kinematics system. We validate the system by tightly coupling it with a user interface, and by performing a user study, in addition to quantitative comparisons.

translated by 谷歌翻译

Find the Funding: Entity Linking with Incomplete Funding Knowledge Bases

Gizem Aydin , Seyed Amin Tabatabaei , Giorgios Tsatsaronis , Faegheh Hasibi

分类：自然语言处理 | 机器学习

2022-09-01

从学术文章中自动提取资金信息为行业和研究社区增添了重要价值，例如基于收到的资金进行资助组织，研究人员和大学的研究成果，并支持开放访问政策。识别和链接资金实体的两个主要挑战是：（i）知识库（KB）的稀疏图结构，这使得基于图的常用实体链接方法的资金域链接方法，（ii）KB中的缺失实体，这（与最近的零拍方法不同）需要标记实体提及没有KB条目为零。我们提出了一个可以执行零预测并克服数据稀缺问题的实体链接模型。我们的模型建立在基于变压器的提及检测和双重编码模型的基础上，以执行实体链接。我们表明，我们的模型表现优于现有基线。

translated by 谷歌翻译

Bias in (Non)-Contextual Clinical Word Embeddings

Gizem Sogancioglu , Fabian Mijsters , Amar van Uden , Jelle Peperzak

分类：自然语言处理

2022-08-02

临床单词嵌入在各种生物-NLP问题中广泛使用，作为最先进的特征矢量表示。尽管它们在单词的语义表示方面取得了很大的成功，但由于数据集（可能带有统计和社会偏见），他们受到了培训，因此它们可能表现出性别刻板印象。这项研究分析了三种医学类别的临床嵌入性别偏见：精神障碍，性传播疾病和人格特征。在此范围内，我们分析了两种不同的预训练的嵌入，即（上下文化的）临床 - bert和（非上下文）Biowordvec。我们表明，这两种嵌入都偏向敏感的性别群体，但Biowordvec在这三个类别中表现出比临床 - 伯特的偏见更高。此外，我们的分析表明，临床嵌入对于某些医学术语和疾病的高度偏见，这与医学文献相抵触。拥有如此不基调的关系可能会在使用临床嵌入的下游应用中造成伤害。

translated by 谷歌翻译

Machine Learning to Predict the Antimicrobial Activity of Cold Atmospheric Plasma-Activated Liquids

Mehmet Akif Ozdemir , Gizem Dilara Ozdemir , Merve Gul , Onan Guren , Utku Kursat Ercan

分类：机器学习

2022-07-25

血浆定义为物质的第四个状态，在高电场下可以在大气压下产生非热血浆。现在众所周知，血浆激活液体（PAL）的强和广谱抗菌作用。机器学习（ML）在医疗领域的可靠适用性也鼓励其在等离子体医学领域的应用。因此，在PALS上的ML应用可以提出一种新的观点，以更好地了解各种参数对其抗菌作用的影响。在本文中，通过使用先前获得的数据来定性预测PAL的体外抗菌活性，从而介绍了比较监督的ML模型。进行了文献搜索，并从33个相关文章中收集了数据。在所需的预处理步骤之后，将两种监督的ML方法（即分类和回归）应用于数据以获得微生物灭活（MI）预测。对于分类，MI分为四类，对于回归，MI被用作连续变量。为分类和回归模型进行了两种不同的可靠交叉验证策略，以评估所提出的方法。重复分层的K折交叉验证和K折交叉验证。我们还研究了不同特征对模型的影响。结果表明，高参数优化的随机森林分类器（ORFC）和随机森林回归者（ORFR）分别比其他模型进行了分类和回归的模型更好。最后，获得ORFC的最佳测试精度为82.68％，ORFR的R2为0.75。 ML技术可能有助于更好地理解在所需的抗菌作用中具有主要作用的血浆参数。此外，此类发现可能有助于将来的血浆剂量定义。

translated by 谷歌翻译

Fact sheet: Automatic Self-Reported Personality Recognition Track

Francisca Pessanha , Gizem Sogancioglu

分类：计算机视觉

2022-07-22

我们提出了一个知情的基线，以帮助解散此类案例研究中影响的各种影响因素。为此，我们分析了给定的元数据与自我分配的人格特质分数之间的相关性，并仅基于该信息开发了模型。此外，我们将该知情基线的性能与基于最先进的视觉，语言和音频功能的模型进行了比较。对于本数据集，与简单的音频，语言或基于视觉功能的系统相比，仅根据简单的元数据功能（年龄，性别和会话数）进行了训练的模型。

translated by 谷歌翻译

A Structured Dictionary Perspective on Implicit Neural Representations

Gizem Yüce , Guillermo Ortiz-Jiménez , Beril Besbinar , Pascal Frossard

分类：机器学习 | 计算机视觉

2021-12-03

通过新的设计推动，允许规避光谱偏差，隐式神经表示（INRS）最近被出现为具有古典离散化表示的有希望的替代方案。尽管如此，尽管他们的实际成功，我们仍然缺乏inrs代表信号的正确理论表征。在这项工作中，我们的目标是填补这一差距，我们提出了一种在理论上分析inrs的新颖统一视角。利用谐波分析和深度学习理论的结果，我们表明大多数INR系列类似于结构化信号词典，其原子是初始映射频率集的整数谐波。该结构允许INR使用只有许多只能与深度线性增长的参数表达频率支持的信号。之后，我们探讨了初步结果关于经验神经切线内核（NTK）的近期结果的归纳偏见。具体地，我们表明NTK的特征功能可以被视为其内部产品与目标信号的内部产品确定其重建的最终性能。在这方面，我们揭示了Meta学习初始化具有类似于字典学习的NTK的重塑效果，构建字典原子作为在Meta训练期间看到的例子的组合。我们的业绩允许设计和调整小说INR架构，但对更广泛的深度学习理论界也可能感兴趣。

translated by 谷歌翻译